Nguyên nhân Facebook ngừng hoạt động 2021

Các trình phân giải DNS chính trả về trạng thái “SERVFAIL” cho Facebook.com.

Các chuyên gia bảo mật xác định rằng Border Gateway Protocol (BGP) đã rút tiền tố địa chỉ IP mà máy chủ tên miền của Facebook được lưu trữ khiến người dùng không thể phân giải tên miền của Facebook và các tên miền liên quan cũng như tiếp cận các dịch vụ.[2][9] Sự cố gây ảnh hưởng trên phạm vi toàn cầu; ví dụ, nhà cung cấp dịch vụ Internet của Thụy Sĩ Init7 đã ghi nhận sự sụt giảm lớn về lưu lượng truy cập Internet đến các máy chủ của Facebook sau khi có sự thay đổi trong Border Gateway Protocol.[10]

Cloudflare đã báo cáo rằng vào lúc 15:39 UTC, Facebook đã thực hiện một số cập nhật BGP đáng kể bao gồm việc rút các tuyến đến các tiền tố IP và tất cả các máy chủ có thẩm quyền của họ. Điều này khiến cho các máy chủ DNS của Facebook không thể truy cập được khi sử dụng Internet. Đến 15:50 UTC, các tên miền của Facebook đã hết hạn và rút khỏi bộ nhớ đệm trong tất cả các trình phân giải công cộng lớn. Trước 21:00 UTC, Facebook thông báo rằng họ đang tiếp tục cập nhật BGP. Vào lúc 21:05 UTC, tên miền của Facebook đã có thể phân giải trở lại.[11]

Trong quá trình thực hiện công việc bảo trì định kỳ trên hệ thống cột trụ (backbone) của Facebook, một lệnh đã được tạo ra nhằm đánh giá khả năng cung cấp của backbone trên toàn cầu, điều này đã vô tình làm ngắt kết nối giữa các trung tâm dữ liệu của Facebook đến Internet. Hệ thống của Facebook được thiết kế để kiểm tra các lệnh nhằm ngăn chặn những sai lầm như thế này, nhưng một lỗi trong công cụ kiểm tra đó đã làm nó dừng lệnh đúng cách.

Sự thay đổi đó khiến các kết nối với máy chủ của Facebook giữa các trung tâm dữ liệu và Internet của mọi người bị ngắt kết nối hoàn toàn. Sự cố mất kết nối đó đã gây ra sự cố thứ hai khiến mọi thứ trở nên tồi tệ hơn. Để đảm bảo việc hoạt động đáng tin cậy, các máy chủ DNS của Facebook đã vô hiệu hóa các quảng bá đến BGP. Kết quả cuối cùng là các máy chủ DNS của Facebook không thể truy cập được mặc dù chúng vẫn đang hoạt động. Điều này đã khiến cho trang web không thể tự tìm thấy máy chủ của chính mình.[12]

Facebook dần hoạt động trở lại sau khi một nhóm người có quyền truy cập phải đến tận máy chủ tại trung tâm dữ liệu tại Santa Clara, California để cài đặt lại.[4] Đến khoảng 22:45 UTC, Facebook và các dịch vụ liên quan khác đã hoạt động trở lại.[13]